使用流暢性改善詞組翻譯的統計式機器翻譯 (Using Phrase and Fluency to Improve Statistical Machine Translation) [In Chinese]
نویسندگان
چکیده
منابع مشابه
以共現資訊為基礎增進中學英漢翻譯試題與解答之詞彙對列 (Using Co-Occurrence Information to Improve Chinese-English Word Alignment in Translation Test Items for High School Students) [In Chinese]
本文探討我國中學程度翻譯試題的中文試題與英文解答的詞彙對列問題。我們先利用漢 英字典作為基礎,找尋互為翻譯的漢英詞對;然後利用未被對列的剩餘詞彙之間的共現 關係,以五種過去在文獻中探索過的計分方式,來尋找與界定更多的互譯詞彙組合。在 超過 17,000 道試題為基礎的測試中,我們以人工檢視計分機制給予高分的部分對列詞 彙的正確性。實驗結果顯示,進一步利用未對列詞彙的方法,可以把對列成果的 F measure 從 76.9%提高到 83.7%。 Abstract We study the word alignment between the Chinese problems and the English answers for the English-Chinese translation tests at the high school level in Taiwan. After...
متن کامل讓格書寫以及台華互譯初探 (LangGeh Orthography and an Initial Study of Statistical Translation Between Taiwanese and Mandarin) [In Chinese]
LangGeh orthography is a new writing style proposed by [1]. For Han family languages such Taiwanese or Mandarin that uses Chinese character, LangGeh proposes writing with spaces in-between, using simple short phrase as a unit. This is in contrast to word-based orthography in English and sentence-based orthography in traditional Mandarin. Easy to add spaces, LangGeh has the advangtages of reduci...
متن کامل以語言模型判斷學習者文句流暢度(Analyzing Learners 'Writing Fluency Based on Language Model)[In Chinese]
由於現代科技以及 3C 產品的普及,使得孩子頻繁的接觸電視、網路、手機...等,因此 容易缺乏與人之間互動、溝通以及情感的表達,相對的,學生寫的作文常常是以流水帳 交代經過,有的學校甚至不考作文,但隨著教育政策的變動,國中教育會考加入了作文 評量的項目,使的作文再度受到學生及家長的重視。可是受限於學校教學時數,作文較 弱的學生容易缺少補救的機會。我們認為未來自學作文以及在家練習,可以藉由自動化 的作文教學系統輔助。而本系統開發作文教學系統之句子流暢度偵測,經由系統回饋的 診斷結果可以讓學生對詞句組合的理解力有所提升,幫助學生寫出較流暢的句子,藉此 提高他們的作文分數。系統所依賴的 N-gram 語言模型,它的特性是計算字詞間組合的 機率,機率越高的話字詞組合的正確性越高也就是越流暢,而語言模型效果相當依賴大 型的訓練語料,這是語言模型然能待克服的缺點,例如資料稀疏(Data spar...
متن کامل以語言模型評估學習者文句修改前後之流暢度(Using language model to assess the fluency of learners sentences edited by teachers)[In Chinese]
隨著科技的發展,現在 3C 產品可說是非常的普遍,也因為如此現在非常多的孩子從小就 接觸電腦、手機、平板等 3C 產品,使得現在學生更有可能以電腦作為寫作文的工具。雖 然教育政策將作文納入考試評分項目,使得學生跟家長再度重視寫作能力,但是受限於 教學時數,可以練習寫作的時間實在是不足以將那些寫作能力較弱的學生作有效提升。 因此我們認為未來可以藉由自動化的作文教學系統幫助學生在家自學作文。而我們所開 發作文教學之句子流暢度偵測系統,經由系統回傳的診斷結果,幫助學生提升詞句組合 的理解能力以寫出較順暢的句子,藉此提升他們作文的分數。本系統依賴 N-gram 的語言 模型[1],其特色是計算字詞間組合的機率,機率越高字詞組合的正確性就越高句子也就 越順暢,然而語言模型其效果相當依賴大型的訓練語料,這是語言模型仍待克服的問題, 而且如果訓練語料的性質跟要測試的文章性質越不相關,效果就會越差,...
متن کامل使用關聯法則為主之語言模型於擷取長距離中文文字關聯性 (Association Rule Based Language Models for Discovering Long Distance Dependency in Chinese) [In Chinese]
摘要 本論文提出一種能擷取長距離資訊的語言模型,它可以擷取多詞彙之間的關 聯性,擷取的方式是使用資料探勘中十分流行的 Apriori 演算法,傳統上 n-gram 語言模型只能在 n-gram 視窗內擷取到有限距離的資訊,較長距離的資訊也就因 此而流失,然而這些失去的長距離資訊對於語言模型是十分重要的,所以如何克 服 n-gram 模型缺乏長距離資訊一直是非常熱門的研究課題,觸發序對就是其中 一種有效的方法,其主要功能是在擷取長距離之詞序對資訊,也就是建立起詞與 詞之間的關聯性,然而我們所提出的關聯法則技術能擷取多元詞組間的關聯性, 可以說是進一步改良詞組數並建立更長距離資訊,而實驗結果也顯示本論文方法 比起傳統觸發序對獲得較低的 perplexity,此關聯法則技術也可以有效的與其他 模型調整及模型平滑化的技術結合,在語言模型的效率改善方面能有更良好的效 果,最後本論文也將提出的語...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2006